## Loading required package: DBI
## 
## Attaching package: 'lubridate'
## The following objects are masked from 'package:base':
## 
##     date, intersect, setdiff, union
## 
## Attaching package: 'hms'
## The following object is masked from 'package:lubridate':
## 
##     hms
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

Recopilación de datos iniciales

La meteorología es una ciencia que estudia los comportamientos de la atmósfera con un enfoque principal en la predicción del clima. Todas las condiciones climáticas conocidas son producto del calentamiento desigual de la tierra por medio de la magnitud radiación solar en el planeta en son con las rotaciones del planeta, sea sobre su eje o su órbita. La incidencia de la radiación solar genera cambios en dos variables que son primordiales para la realización de cualquier estudio meteorológico, la temperatura y la presión.

La radiación calienta las masas de aire elevando su temperatura, haciéndolas menos densas y disminuyendo su presión, este fenómeno genera espacios en la atmósfera de alta y baja presión, y en un natural esfuerzo por corregir esta desigualdad las masas de aire inician sus movimientos desde zonas de alta presión a las de baja presión. Desde este punto, ya se empiezan a generar fenómenos perceptibles fácilmente por el ojo humano, como la formación de nubes que, dependiendo del grado de humedad en el aire y la brusquedad de la incidencia de los frentes de alta presión, desencadenan riesgos reales sobre la zona geográfica afectada, mediante precipitaciones leves a tormentosas.

De esta forma, el montado de los sensores de este proyecto hacen registro de estas variables esenciales para cualquier esfuerzo de pronóstico meteorológico. Estas tres variables son:

Exploracion de datos locales

Entendiéndose por “locales” a aquellos datos generados por los sensores montados cumpliendo el objetivo específico 1 del proyecto, ha de hacerse consulta al servidor de la carrera puesto a que en éste se encuentran centralizados los registros de los sensores De este forma habrimos conexión a la base de datos, solicitamos los registros y los guardamos en un dataframe

## Warning in .local(conn, statement, ...): Decimal MySQL column 2 imported as
## numeric
## Warning in .local(conn, statement, ...): Decimal MySQL column 3 imported as
## numeric
## Warning in .local(conn, statement, ...): Decimal MySQL column 4 imported as
## numeric
## Warning in .local(conn, statement, ...): unrecognized MySQL field type 7 in
## column 5 imported as character

Las advertencias explican que el tipo de datos de ciertas columnas fueron alteradas para poder ser utilizadas como dataframe, de la siguiente forma

Transformación de fechas

Considerando, como en todo fenómeno físico, el tiempo como variable independiente del dataset, es que es de suma importancia asegurar el tipo de dato del momento de registro (CREATED) con tal de asegurar su consistencia para manipulación matemática Lo anteriormente dicho se refuerza en el hecho de que las variables climáticas son dependientes de la intensidad de la radiación solar, la cual se hace presente de forma cíclica a través del tiempo

Considerando que la exposición de la tierra al sol varía en ciclos de 24 horas y 12 meses es que se hace separación de los registros de hora y fecha

Resumen de datos

Se asegura la correcta importación de datos mediante chequeo de las primeras filas del dataset y la integridad de los tipos de datos mediante cálculo de estadísticas comunes

##   ID REMOTE_ID AMBIENT_TEMPERATURE AIR_PRESSURE HUMIDITY             CREATED
## 1  1        NA               25.71      1008.41    42.63 2021-04-10 21:39:30
## 2  2        NA               25.71      1008.46    42.63 2021-04-10 21:39:30
## 3  3        NA               25.71      1008.36    42.64 2021-04-10 21:39:30
## 4  4        NA               25.70      1008.37    42.65 2021-04-10 21:39:30
## 5  5        NA               25.71      1008.39    42.64 2021-04-10 21:39:30
## 6  6        NA               25.71      1008.35    42.65 2021-04-10 21:39:30
##               dateUTC onlyTime   onlyDate
## 1 2021-04-10 21:39:30 21:39:30 2021-04-10
## 2 2021-04-10 21:39:30 21:39:30 2021-04-10
## 3 2021-04-10 21:39:30 21:39:30 2021-04-10
## 4 2021-04-10 21:39:30 21:39:30 2021-04-10
## 5 2021-04-10 21:39:30 21:39:30 2021-04-10
## 6 2021-04-10 21:39:30 21:39:30 2021-04-10
##        ID          REMOTE_ID     AMBIENT_TEMPERATURE  AIR_PRESSURE 
##  Min.   :  1.0   Min.   :11.00   Min.   :15.57       Min.   :1006  
##  1st Qu.:206.2   1st Qu.:12.00   1st Qu.:18.24       1st Qu.:1008  
##  Median :411.5   Median :12.00   Median :20.93       Median :1012  
##  Mean   :411.5   Mean   :11.81   Mean   :21.12       Mean   :1011  
##  3rd Qu.:616.8   3rd Qu.:12.00   3rd Qu.:24.63       3rd Qu.:1013  
##  Max.   :822.0   Max.   :14.00   Max.   :26.21       Max.   :1016  
##                  NA's   :76                                        
##     HUMIDITY       CREATED             dateUTC                   
##  Min.   :39.31   Length:822         Min.   :2021-04-10 21:39:30  
##  1st Qu.:45.01   Class :character   1st Qu.:2021-05-15 20:55:17  
##  Median :55.56   Mode  :character   Median :2021-06-23 09:14:28  
##  Mean   :54.03                      Mean   :2021-06-03 00:11:37  
##  3rd Qu.:58.00                      3rd Qu.:2021-06-23 20:00:15  
##  Max.   :68.88                      Max.   :2021-06-23 23:04:42  
##                                                                  
##    onlyTime           onlyDate         
##  Length:822        Min.   :2021-04-10  
##  Class1:hms        1st Qu.:2021-05-15  
##  Class2:difftime   Median :2021-06-23  
##  Mode  :numeric    Mean   :2021-06-02  
##                    3rd Qu.:2021-06-23  
##                    Max.   :2021-06-23  
## 

Visualización de datos

Temperatura

Para iniciar, consideramos que nos interesa estudiar la evolución de las variables climáticas a través del tiempo, por ende, es que para todo tipo de gráfico a realizar, las variables temperatura, presión y humedad tendrán un eje dedicado y dependiente del momento en que fueron registradas. Bajo esta premisa de estudio, es que son útiles las gráficas de línea y de puntos De esta forma iniciamos la visualización de datos graficando todos los registros de temperatura

Como se puede observar, los datos se encuentran dispersos y corresponden a registros diarios inconexos aunque con una ligera tendencia a la baja, por ende, es de mayor utilidad visualizarlos en un marco de 24 horas.

Hacemos zoom a las horas en que se ubica la mayor cantidad de datos.

Humedad relativa

De esta forma, exploramos mediante los mismos pasos la evolución de la humedad relativa y la presión atmosférica

  1. Evolución de la variable a través del año
  2. Evolución de la variable a través de las horas

Se puede observar que la humedad relativa tiende a aumentar en las épocas más frías del año a la vez que también aumenta en las horas nocturnas, sin embargo, no se puede confirmar su comportamiento periódico (ciclo cada un día) sin un registro continuo de 24 horas.

Presión atmosférica

Teóricamente, a diferencia de la temperatura y la humedad relativa, la presión atmósferica se llega a dos máximos locales en un rango de 24 horas, primero y naturalmente en las horas de mayor exposición solar pues el calor disminuye la presión de las masas de aire sobre el agua, pero otra vez en las horas nocturnas, pues la drástica pérdida de calor de las masas de agua, disminuye la presión de las masas de aire también. Bajo este concepto, se procede a visualizar la evolución de la presión atmosférica al igual que en pasos anteriores

Se puede observar que la presión tiene tendencia a aumentar en las épocas más frías del año pero esta tendencia es menos clara que las presentes en temperatura y humedad relativa. Si es mas evidente su tendencia a aumentar pasadas las 14 horas del día pero de igual forma, no se puede asegurar su comportamiento periódico sin un registro continuo de 24 horas.

Interrelación de los datos

Analizado los cambios naturales de las variables en el tiempo es que ahora se procede a visualizar la relación entre las distribuciones de las variables. Considerando el pequeño tamaño del dataset es que se grafican las observaciones de forma cruda mediante puntos, utilizando una gradiente de colores para visuzalizar una tercera variable

En las gráficas se puede observar la formación de clústeres de datos, como en este caso el momento de creación de los registros no es de importancia, los registros actuales del set de datos son suficientes para afirmar la existencia de una correlación entre las variables climáticas las cuales, podrían ser las siguientes:

  1. A mayor temperatura, menor humedad relativa del aire
  2. La presión atmosférica tiene un comportamiento en mayor parte independiente de las otras variables

Exploracion de datos externos (Dirección General de Aeronáutica Civil)

Con el fin de entender las diferencias de los datos locales con aquellos oficiales para la ciudad de Iquique es que se debe hacer uso de datos proveídos por la Dirección General de Aeronáutica Civil (DGAC). De forma preliminar, luego de inspeccionar los datos en su forma de texto se puede afirmar que son de calidad, pues a pesar de ofrecer cada variable climática mediante un distinto archivo .csv, todos estos archivos poseen la misma cantidad de registros tomados en momentos coincidente (tramos de cada 1 hora), lo cual facilita su mezcla y visualización > Del mismo modo que para datos locales, los datos de tipo fecha han de ser transformado de caracter a date para poder operar matemáticamente sobre ellos

Exploracion de datos externos por variable

Los gráficos de las observaciones se presentan para cada variable del siguiente modo:

  1. Evolución de la variable durante el año
  2. Evolución de la variable a través del día
  3. Distribución de la variable a traves del día, separando por meses del año, con tal de detectas una tendencia
temp <- read.csv("../data/2021/200006_2021_Temperatura_.csv",header = TRUE, sep = ";")
hum <- read.csv("../data/2021/200006_2021_Humedad_.csv",header = TRUE, sep = ";")
qfe <- read.csv("../data/2021/200006_2021_PresionQFE_.csv",header = TRUE, sep = ";")
dgac=merge(temp,hum,by="momento")
dgac=merge(dgac,qfe,by="momento")
dgac$utc<-dmy_hms(dgac$momento)
dgac$onlyTime<-as_hms(dgac$utc)
dgac$onlyDate<-date(dgac$utc)
rm(hum)
rm(qfe)
rm(temp)

Temperatura con respecto al tiempo

En estas gráficas, debido a la mayor cantidad de registros se puede observar de forma clara los comportamientos que rigen las variaciones de temperatura:

  1. La temperatura, desde enero, ha tendido a bajar continuamente luego de alcanzar su peak en la mitad de febrero
  2. Tiene un comportamiento cíclico cada 24 horas pronunciado, alcanzando su peak a las 18:00 horas y su mínimo global entre las 10 y 12 horas
  3. Este comportamiento cíclico es independiente del momento del año
  4. El avance del año disminuye el promedio de temperatura de los registros, más no (o en menor grado) su varianza

Humedad relativa con respecto al tiempo

En estas gráficas, debido a la mayor cantidad de registros se puede observar de forma clara los comportamientos que rigen las variaciones en la humedad relativa del aire:

  1. La humedad, desde enero, ha tendido a incrementar, de forma inversamente proporcional a la tempertarua pero con tendencia menos pronunciada, luego de alcanzar su punto más bajo en la mitad de febrero
  2. Tiene un comportamiento cíclico cada 24 horas pronunciado pero menos rígido, alcanzando su mínimo global a las 18:00 horas y su peak entre las 10 y 12 horas
  3. Este comportamiento cíclico es independiente del momento del año
  4. El avance del año aumenta el promedio de temperatura de los registros, más no (o en menor grado) su varianza

Presión atmosférica con respecto al tiempo

En estas gráficas, debido a la mayor cantidad de registros se puede observar de forma clara los comportamientos que rigen las variaciones en la presión atmosférica:

  1. La presión, desde enero, ha tendido a aumentar continuamente luego de alcanzar su mínimo global en inicios marzo
  2. Tiene un comportamiento cíclico cada 24 horas pronunciado, alcanzando máximos locales a las 3 y 14 horas, además mínimos locales en las 9 y 21 horas
  3. Este comportamiento cíclico es independiente del momento del año
  4. El avance del año aumenta el promedio de presión de los registros
  5. Al igual que su varianza

Exploracion de datos externos, relación entre variables

  1. Generalizando, La humedad junto a la presión, guardan una relación inversamente proporcional con la temperatura
  2. La magnitud de esta relación es menos fuerte entre presión-temperatura
  3. Estas relaciones se mantienen durante el avance del año, pero cambia su promedio